작년 구축 데이터 310종, AI허브서 7월 말까지 순차 개방 과학기술정보통신부와 한국지능정보사회진흥원은 지난해 구축한 인공지능 학습용 데이터 세트 310종을 7월 말까지 'AI허브'(aihub.or.kr)를 통해 순차적으로 개방한다고 30일 밝혔다. 데이터 건수로는 15억 건에 해당하는 역대 최대 규모로, 데이터 구축 분야가 지난해부터 제조·로보틱스·교육·금융·스포츠 등 14개로 증가한 영향이라고 과기정통부는 설명했다. 이날부터 1차 개방되는 데이터는 고서(古書) 속 한자·한글의 광학인식(OCR) 데이터, 실내외 군중 특성 데이터, 소방대원 행동 모션 3차원(3D) 객체 데이터 등 자연어와 인공지능 비전 분야의 데이터 70종이다. AI허브에 공개되는 데이터는 개인정보 비식별화를 거친 경우에 한한다. 지난해에는 데이터 190종을 개방하면서 AI허브 연간 방문자 수가 최초로 1백만 명을 넘어섰다고 과기정통부는 전했다. 엄열 인공지능정책관은 "기존의 라벨링 데이터 중심의 사업을 개편해 초거대 AI 학습에 필요한 대규모 비라벨링 데이터와 한 번에 여러 가지 유형을 학습시킬 수 있는 다중 임무형 라벨링 데이터 등 다양한 유형의 데이터를 확보할 예정"이라고 말했다.
마이데이터 전문기업 에스앤피랩(대표 이재영)은 교통혼잡 문제 해소를 위한 ‘2022년 인공지능 학습용 데이터 구축 사업’에 선정됐다고 밝혔다. 2022년 인공지능 학습용 데이터 구축 사업은 과학기술정보통신부가 주관하고 한국지능정보사회진흥원이 추진하는 사업으로 다양한 교통수단 판별 및 이동 궤적 데이터 구축을 목표로 한다. 에스앤피랩을 비롯해 모토브, 비투엔, 한국능률협회컨설팅 등으로 구성된 컨소시엄은 오는 12월까지 이 사업을 수행한다. 이 사업을 통해 에스앤피랩이 포함된 컨소시엄은 인공지능 기반 스마트폰 센서를 활용한 다양한 교통 데이터를 구축으로 교통 수요 예측 가능한 인공지능 활용모델을 제안할 계획이다. ‘크라우드워커’ 모집, 선정, 관리하는 역할을 맡은 에스앤피랩은 대중교통 이용, 택시/자가용, 자전거 등을 효과적으로 분석하기 위해 교통수단별 이용 빈도를 고려하여 크라우드워커를 모집하고 참여자를 관리할 예정이다. 또한, 안전하게 신청자 정보를 수집하기 위해 블록체인 기반의 마이데이터 앱인 ‘마이디’로 크라우드워커를 모집할 계획이다. 에스앤피랩 이재영 대표는 “이 사업으로 지역별, 요일별, 시간대별 교통 수요 예측 및 교통 혼잡 지점 예측을 통해 교통체
헬로티 이동재 기자 | 과학기술정보통신부(이하 과기정통부)가 디지털 뉴딜 ‘데이터 댐’의 핵심과제인 ‘인공지능 학습용 데이터 구축사업’의 성공적인 추진과, 크라우드워커 등 참여 인력의 성장· 발전을 위한 상호 협력을 다짐하는 상생협약식을 6일 개최했다. 이날 행사는 메타버스 방식으로 크라우드워커 및 크라우드소싱 참여기관(3개), 네이버, SK 등 대표 수행기업(6개) 관계자와 과기정통부 조경식 제2차관, 한국지능정보사회진흥원 문용식 원장 등 총 500여명이 동시 접속해, 상생협약을 위한 온라인 서명 등을 진행했다. 인공지능 학습용 데이터 구축사업은 인공지능 서비스 개발에 필수적인 인공지능 학습용 데이터를 대규모로 구축·개방하는 사업으로 지난해 3.1만여 명의 크라우드워커가 참여하여 170종의 데이터를 구축했고, 올해 6월 개방 이후 한 달 만에 1만 2천 건이 넘는 다운로드를 기록하는 등 관심도 뜨겁다. 올해는 190종의 데이터를 추가로 구축하기 위해 총 545개 기업·기관이 함께 사업을 진행해나갈 계획이다. 협약식에 참석한 모든 기관들은 인공지능 시대를 선도할 핵심자원인 활용도 높은 양질의 데이터를 성공적으로 구축하고, 코로나19로 인한 일자리 위기를 극복